军事人工智能的五大基石
本文作者理查德库兹玛,毕业于哈佛大学,现就职于美国国防创新部门实验室(DIUx),他领导创建了世界上最大的顶级图像数据集之一xView。目前正在为国防部策划一个机器学习项目。
warontherocks.com(2018.7.13)
https://warontherocks.com/2018/07/but-first-infrastructure-creating-the-conditions-for-artificial-intelligence-to-thrive-in-the-pentagon/
人工智能并不有趣。2017年我领导了xView的数据创建和质量控制,xView是世界上最大的开源顶置卫星图像数据集之一。我每天花几个小时眯着眼睛看着卫星图像,看着成千上万的物体,并试图区分推土机和拖拉机之间的微小像素差异。
数据是人工智能的生命,是美国军方采用这些新技术时需要加强基础设施的关键部分。但现在国防部过分关注人工智能如何从根本上改变作战行为,而不是那些不那么有趣的(但更重要的)基础设施、组织和文化变革,这些变化需要在人工智能能够实现之前实施。
国防部部长到普通人,都已认识到人工智能的重要性,但对人工智能军事价值的认识才刚开始而不是已经完成了。人工智能是一种革命性的支持技术,能够改善国防部的任务,从情报收集到预测,供应链管理,网络安全和风险管理。但它是一种支持性技术,而不是一个独立的武器(如同电力或内燃机一样),人工智能必须融入国防部运作的结构,而不是几个相互孤立的大型曼哈顿计划一样的大工程。
人工智能的应用场景固然很重要,但现在的重点应该在于放在人工智能所需的不太性感的采集过程、组织结构和数字基础设施,或那些验证和维持能力。国防部知道它需要创新也知道怎样创新,但正如2018年国防战略指出的,它还必须推动“组织变革”。
数字价值链的
五个环节
人工智能看起来可能很有意思,但进入以人工智能为中心的军队的过程并非如此。国防部需要建立必要的基础设施,有时被称为“数字价值链”。链中的第一个链接是大型的、标记了的数据集,用于教机器学习模型寻找什么。其次,部门需要一个数据存储的云环境和训练算法模型所需的计算能力,以便从标记的数据中学习。第三步是开发和操作环境,软件开发人员与操作团队一起工作,负责管理算法的部署,以连续地将一小段代码分成几个部分,而不是一次性地大量地执行。第四,由人工智能专家、终端用户(作战人员)、用户体验/用户界面设计人员和来自国防工业基地的系统集成商组成的小型跨职能团队应该一起工作,执行“冲刺”:在完成特定工作并进行评审之后,再进行下一个迭代或冲刺。其中一个很好的例子就是Project Maven,它使用计算机视觉模型来检测和识别无人机拍摄的全动态视频中捕获的物体。第五是整个国防部的文化,重视原型和装备能力,而不仅仅是实验室研究。
1)标记的数据集
今天的大多数模型需要大量的标记数据(即图像由人类标记,具有机器“学会”识别的“ 基本事实 ”,当它看到类似数据时它可以正确预测)。具有更高质量数据的一般模型,可以比质量或数量相对较少的高级模型表现更好。在上个月,Connor McLemore和Hans Lauzen指出数据标签成本又高又耗时。我同意这一点而且我知道这是来自一线人员的声音。
但我们不应将数据标签视为一种挑战,而应将其重新定义为一种机遇。美国国防部已经拥有了大量的数据,并投入了数十万美元和多年的时间来培训数据标签员:聘请具有系统专业知识和实践的技术人员。美国海军的声纳技术人员正在标识来袭的声波信号,以区分俄罗斯潜艇和鲸鱼。空军图像分析人员标识出东欧的民用车辆和装甲运兵车。这是一种数据标记形式。问题不在于部门不能标记数据,而在于几乎没有一种人工智能可以制作数据标签。
2)云环境
如果无法将其保存在可以安全访问的地方,那么世界上所有标记的数据都没有用。在近600个人工智能项目里,很少有不做出原型而仅凭早期研究就能成为长期在案项目的。人工智能在政府实验室的工作是至关重要的,它商业部门迅速取得的进展是一种补充。但不同之处在于,商业公司能够将其研究部署并实施下去。谷歌和Alphabet前董事长埃里克•施密特(Eric Schmidt)今年4月对国会表示,“任何未能实现全局级云计算的军队,都无法深入思考如何在未来的冲突中获胜。”
五角大楼可能会遵循情报界的例子来寻求云解决方案,以允许其各个机构共享和使用外部数据流并建立彼此的研究,而不是每个组织重复基础研究和开发。该解决方案应该从信誉良好的AI或技术公司,而不是传统的国防承包商处获得。2017财年国防部花费在人工智能,大数据和云计算上的74亿美元中的大部分用于承包商。而不是人工智能领导者谷歌,亚马逊,苹果,英特尔和微软。
3)敏捷的软件开发环境
培训人工智能模型需要一个存储数据和访问计算能力的地方,以使用该数据来训练模型,云计算环境提供了这两点。但同样重要的是,它可以实现快速创建和部署以用户为中心的产品所需的敏捷开发流程和文化。如果没有这样的流程,部门将无法在整个计划的开发过程中找到并修复缺陷,或者适应用户不断变化的需求。国防部的反突发威胁挫败联合组(Joint Improvised-threat Defeat Organization)和空军的凯泽尔项目(Project Kessel )都成功地实现了云环境:通过软件开发人员和作战人员之间的动态持续的协同,快速连续地交付软件。这种敏捷软件开发、部署和维护的文化应该被复制到其他的国防部的机构和项目中,以允许更多的团队使用AI来解决他们的问题。
国防部在招聘顶尖AI技术人才方面遇到困难已经不是什么秘密了。然而并不是低工资吓跑了有才华的工程师。顶尖人才会被最困难的技术难题所吸引,而国防部就面临着最困难的技术难题,这些难题需要世界顶尖的专家,使他们至少能够在短期内投身其中。问题是现在国防部无法提供这些工程师所需的必要工具(云,标记数据,敏捷开发和操作方法以及机器学习基础设施)。
4)集成团队或者类“Maven”的集成、迭代和扩展
国防部面临的挑战,与其说是在人工智能领域取得新进展,不如说是在创造一种文化,使私营部门现有的进步能够融入军事项目和军事行动。Maven项目作为美国军方的人工智能项目受到了媒体的广泛关注。一个由平民和预备役人员组成的小型国防部小组与行业专家合作,将计算机视觉模型部署到作战部队中。军方需要更多这样的团队:行业工程师、学术专家、用户、获取专家和系统集成商,共同开发解决方案、测试和评估它们的速度、迭代、重新部署,并最终成为长期在案项目。
然而问题仍然是如何成功地发展为长期在案项目,尤其是在这个项目失去了前国防部副部长鲍勃·沃克(Bob Work)和他的继任者帕特里克·沙纳汉(Patrick Shanahan)所掌握的监督和决策权后。如果每次整合都需要高级领导人的直接监督和支持,国防部不可能将AI能力整合进数十个长期在案项目。技术解决方案是存在的,但促使它们蓬勃发展的意愿并不存在。
5)文化
改变部门的思维方式将是最困难的一步:从大型,长期,孤立的“ 烟囱式 ”项目到更小,更快,更协作的敏捷方法;从长达几年的联邦采购法规签约到快速签约其他交易机构,从允许小修小补到大刀阔斧的改革,这超出了人工智能的技术含义。国防部有一种管理文化但不是一种进取的文化。我们自认为美军是当今世界最伟大的军队,却无法做出改变以确保未来我们是最伟大的军队。
采取人工智能的整体军事努力需要新的思维,这反过来又需要教育军事人员达到基本的人工智能水平,无论是技术,战术还是战略。战士需要通过AI寻找问题的解决方案,项目经理必须学会快速行动并接受风险,研究实验室必须愿意加速他们的基础研究,并采取可以使其研究化作现实的机制。最后国防工业必须学会把那些提供新颖服务的小快灵公司视为机遇而非威胁。
结论
国防部的位置不是很有利。这是一个没准备改变但却急需改变的组织。而需要改变的不是一个华而不实的标题或新的创新部门,它是一种新的运营结构:技术和文化。国防部不管是打算仅在物流和情报收集中使用人工智能,或是打算有一天将其无缝集成(如内燃机,电力或计算机一样)进入所有军事任务之中,它必须首先建立一个基础。这不仅意味着利用人工智能的数据,存储和计算能力的技术支柱,而且还意味着远离缓慢,过时的文化。
人工智能种族难以接受的事实是:如果美国输了,那将是它自己导演的。美国的科技产业是世界上最具创新力的产业,并且已经解决了许多军方试图采用的人工智能案例。技术解决方案是存在的,但采用它们的意愿却不存在。美国不仅需要研究,还需要原型和集成最先进的技术,才能使人工智能超越报纸头条,走向未来战场的胜利。